|
Rozpoznávání izolovaných slov
Ondruška, Jiří ; Švrček, Martin (oponent) ; Kolářová, Jana (vedoucí práce)
Rozpoznávání lidské řeči v biometrických systémech je aktuální problematika, kterou se věda intenzivně zabývá. Mezi nejefektivnější metody spadá využití skrytých Markovových modelů. Při rozpoznávání izolovaných slov je pozornost zaměřena na získání charakteristických parametrů z řečových signálů umožňující co nejjednoznačnější identifikaci pomocí aplikace skrytých Markovových modelů. Tato práce se zabývá biometrickými systémy, jejich metodami a následně se zaměřuje na problematiku rozpoznávání izolovaných slov. Je navržen systém rozpoznávání metodou skrytých Markovových modelů, v němž jsou využity funkce systému Matlab. Návrh je zaměřen na získání charakteristických parametrů izolovaných slov, vytvoření kódové knihy prostřednictvím vektorové kvantizace, trénování modelů slov a nakonec vyhodnocení pravděpodobnosti shody pro pozorované slovo a daný model slova. Úspěšnost rozpoznání pro jednoho řečníka dosahuje 40%.
|
| |
| |
|
Rozpoznání jednotlivých písmen ve zvukovém záznamu s využitím SOM
Malásek, Jan ; Honzík, Petr (oponent) ; Honzík, Petr (oponent) ; Pohl, Jan (vedoucí práce)
Bakalářská práce popisuje historické pozadí vývoje neuronových sítí a jejich použití při procesu rozpoznání řeči a uvádí do problematiky práce a učení neuronových sítí. Představuje tři vybrané systémy pro rozpoznání řečového signálu včetně vyhodnocení jejich úspěšnosti v experimentech, výhod a nevýhod. Zabývá se charakteristikou lidské řeči a systémy na její rozpoznávání. Nabízí pohled na spektra signálů různých typů hlásek a dává návod k programování neuronových sítí v prostředí MATLAB.
|
|
Algoritmy rozpoznávání řeči na FPGA/DSP
Urbiš, Oldřich ; Herout, Adam (oponent) ; Szőke, Igor (vedoucí práce)
Tato diplomová práce se zabývá návrhem algoritmů pro rozpoznání řeči s ohledem na výběr cílové technologie, kterou je platforma využívající technologie signálových procesorů a programovatelných hradlových polí. Algoritmy pro rozpoznávání řeči zahrnují, extrakci příznaků v podobě Melfrekvenčních cepstrálních koeficientů, skryté Markovovy modely a jejich vyhodnocení pomocí Viterbiho algoritmu.
|
|
Rozpoznávání rukou psaného textu
Zouhar, David ; Řezníček, Ivo (oponent) ; Mlích, Jozef (vedoucí práce)
Tato diplomová práce se zabývá rozpoznáváním rukou psaných znaků v reálném čase. Popisuje způsoby, kterými jsou zpracovávány vstupní data a klasi kační metody, které se pro rozpoznávání používají. Zvláště se zaměřuje na skryté Markovovy modely. Zabývá se také hodnocením úspěšnosti rozpoznávání, a to na základě provedených experimentů. V rámci této diplomové práce byla také vytvořena alternativní klávesnice pro systém MeeGo. U vytvořeného systému se podařilo dosáhnout úspěšnosti nad 96%.
|
|
Rozpoznávač psaného textu pro mobilní telefony
Talaš, Vladimír ; Chalupníček, Kamil (oponent) ; Schwarz, Petr (vedoucí práce)
Cílem projektu bylo vytvoření aplikace pro mobilní telefon, která by umožnila pomocí zabudovaného fotoaparátu telefonu vyfotografovat snímek v němž by nalezla a rozpoznala text. Tento text by následně bylo možno odeslat v textové zprávě. Aplikace je založena na implementaci algoritmů pro rozpoznávání textu z fotografií. Zejména se bude jednat o metody založené na skrytých Markovových modelech. Důraz je kladen na trénování modelu s cílem maximalizovat úspěšnost při rozpoznávání textu. Jsou prováděny experimenty s parametry modelu, díky čemuž se podařilo dosáhnout více jak 97% úspěšnosti při rozpoznávání textu.
|
| |
|
Ovládání počítače gesty
Jaroň, Lukáš ; Beran, Vítězslav (oponent) ; Španěl, Michal (vedoucí práce)
V této diplomové práci jsou popsány možnosti a principy mnou navrženého uživatelského rozhraní, s jehož pomocí lze ovládat počítač gesty. V práci jsou obecně popsány přístupy pro ovládání gesty a detailněji je vysvětlena implementace zvolené detekce rukou a prstů pomocí hloubkové mapy načítané ze senzoru Kinect. Implementace se též věnuje rozpoznávání gest pomocí skrytých Markovových modelů. Pro demonstrační účely je navržena a implementována aplikace pro prohlížení fotografií, jež využívá vyvinutého uživatelského rozhraní. Práce se též zaměřuje na testování kvality a správnosti vyhodnocování pro zvolený rozpoznávač gest.
|
|
Zvyšování účinnosti strojového rozpoznávání řeči
Zelinka, Petr ; Tučková,, Jana (oponent) ; Nouza,, Jan (oponent) ; Sigmund, Milan (vedoucí práce)
V práci jsou identifikovány příčiny nedostatečné spolehlivosti současných systémů pro automatické rozpoznávání řeči při jejich nasazení v náročných podmínkách. U jednotlivých rušivých vlivů je popsán jejich dopad na úspěšnost rozpoznávání a je podán výčet známých postupů pro identifikaci těchto vlivů analýzou rozpoznávaného signálu. Je též uveden přehled obvyklých metod používaných k omezení dopadu rušivých vlivů na funkci rozpoznávače řeči. Vlastní přínos tkví v navržení nových postupů pro vytváření akustických modelů zašuměné řeči a modelů nestacionárního šumu, díky kterým je možné dosáhnout vysoké úspěšnosti rozpoznávání v náročných akustických podmínkách. Účinnost navržených opatření byla otestována na rozpoznávači izolovaných slov s využitím nahrávky reálného akustického pozadí operačního sálu pořízené na Uniklinikum Marburg v Německu při několikahodinové neurochirurgické operaci. Tato práce jako první přináší popis dopadu změn v hlasovém úsilí mluvčích na spolehlivost rozpoznávání řeči v celém rozsahu, tj. od šepotu až po křik. Je navržena koncepce rozpoznávače řeči, který je imunní vůči změnám v hlasovém úsilí mluvčích. Pro účely zkoumání změn v hlasovém úsilí byla v rámci řešení práce sestavena nová řečová databáze BUT-VE1.
|